Vers un modèle de langue mixte concepts-mots pour la recherche d'information

نویسندگان

  • Lynda Said L'Hadj
  • Mohand Boughanem
  • Karima Amrouche
چکیده

The majority of language models applied to information retrieval is based on word independence hypothesis. More precisely, those models are estimated without considering semantic or conceptual relations between those words. To palliate this problem, two principal approaches have been explored: the first one integrates syntactic dependencies between words (bi-grams, bi-terms) and the second approach is based on the use of semantic resources to integrate words dependencies. The language model proposed in this paper is in the second approach. We propose to relax the independence terms constraint by representing both documents and queries with concepts. MOTS-CLÉS : Recherche d’information, modèle de langue, concepts.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Modélisation de relations dans l'approche modèle de langue en recherche d'information

RÉSUMÉ. Nous abordons dans cet article le problème de la prise en compte de relations (par exemple de nature syntaxique ou sémantique) dans un modèle de langues en recherche d’information. En particulier, nous proposons, sur la base du modèle de langue, un cadre complet pour la prise en compte de relations, étiquetées ou non. Afin d’illustrer ce cadre, nous avons conduit une série d’expériences...

متن کامل

Exploitation des Liens Sémantiques pour l'Expansion de Requêtes dans un Système de Recherche d'Information

RÉSUMÉ: Dans cet article, nous proposons d’exploiter des liens sémantiques entre concepts pour améliorer la recherche d’information. Un thesaurus électronique de langue générale est utilisé pour la reformulation des requêtes utilisateurs en procédant par un processus d’"expansion prudente" en amont d’un moteur de recherche. Ce processus, transparent à l’utilisateur, exploite d’abord la notion d...

متن کامل

Modèle unifié pour la recherche d'information sémantique

Résumé : Un modèle documentaire permet de définir les unités d’indexation (mots, termes, etc.) et de les relier aux documents dans lesquels elles apparaissent. Il permet également de définir les liens entre documents ou portions de documents (ex. citation). Les modèles documentaires sont généralement exploités en recherche d’information pour la représentation des documents et des requêtes et il...

متن کامل

Exploitation des connaissances d'UMLS pour la recherche d'information médicale. Vers un modèle bayésien d'indexation

RÉSUMÉ. La recherche d’information à base de connaissances est largement étudiée, mais avec peu de succès. Dans cet article, nous étudions l’impact de l’exploration d’une base de connaissance, nommée méta thésaurus UMLS pour la recherche d’information médicale. D’abord, l’indexation par concepts d’UMLS extrait dans des textes ne montre qu’une légère amélioration de MAP(Mean Average Precision) p...

متن کامل

Traitement d'attributs inter-dépendants pour la recherche d'information par treillis

HAL is a multidisciplinary open access archive for the deposit and dissemination of scientific research documents, whether they are published or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers. L'archive ouverte pluridisciplinaire HAL, est destinée au dépôt età la diffusion de documents scientifiques de niveau r...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2010